Skip to content

成组数据的T检验

比较两个独立的、互不影响的实验组之间的平均值是否有显著差异

想要比较两个数据之间不同,到底有没有本质的不同,想象一下,你有两组独立的小白鼠(成组数据),你想知道给它们吃不同的饲料(比如饲料 A vs 饲料 B),它们的体重增长有没有本质上的不同。成组 T 检验就是帮你判断这个“不同”是真的由饲料引起的,还是仅仅因为随机波动造成的巧合

成组

两个样本组是完全独立、互不影响

  • 例子 1: 你随机挑 10 只小白鼠喂饲料 A,再随机挑另外 10 只小白鼠喂饲料 B。这两组老鼠互相不认识,吃的饲料也不同,彼此完全独立。这就叫“成组数据”

  • 例子 2: 你想比较男生和女生的平均身高。你测量了 50 个男生和 50 个女生的身高。男生组和女生组是独立的群体

如何才能使用成组数据的 T 检验

  • 独立性:组内观测值互相独立,组间观测值也互相独立
  • 正态性:每个组的数据都应该(近似)遵循正态分布
  • 方差齐性

方差齐性的检验

计算两组的样本方差

分别计算两组的样本方差 S12S22

构造 F 值

F=较大方差较小方差

确定自由度

df1=较大方差 n-1df2=较小方差n-1

确立假设

H0:α12=α22H1:α12α22

进行检验

对于方差齐性的检验为双尾检验,同样查表,看 F 的接受域和拒绝域在哪里区间中

平均数差异显著性检验

确立零假设

假设:

H0:μ1=μ2HA:μ1μ2

T 统计量的计算

t=x¯1x¯2sd/n
  1. 定义配对差值

对于第 i 对观测值:

di=x1ix2i(i=1,2,,n)
  1. 计算差值统计量

·差值均值:

d¯=1ni=1ndi=x¯1x¯2

· 差值标准差:

sd=i=1n(did¯)2n1

对于两个独立样本成组 T 检验而言:

Sp2=(n11)S12+(n21)S22(n1+n22)
  1. 构建 T 统计量

将问题转化为单样本 T 检验:检验差值均值 d¯ 是否显著不等于0

t=d¯0sd/n=x¯1x¯2sd/n

等同于:

t=(x1¯+x2¯)Sp(1n1+1n2)

或者使用这样的方式记忆会更好:

t=x1¯x2¯s12n1+s22n2

我们来一步一步解答这个生态调查问题,判断污染河段鲫鱼的平均体长是否显著小于清洁河段(单尾检验,α=0.05)。


数据准备

污染组(n₁ = 10):

[12.1, 11.8, 13.0, 12.5, 11.9, 12.3, 12.6, 11.7, 12.4, 12.0]

清洁组(n₂ = 8):

[14.2, 13.8, 14.0, 13.5, 14.1, 13.7, 13.9, 14.3]

第一步:计算平均值和标准差(x̄₁, x̄₂, s₁, s₂)

污染组:

  • 平均值 x¯1=12.1+11.8++12.010=12.23

  • 标准差:

    s1=(xix¯1)2n110.39

清洁组:

  • 平均值 x¯2=14.2+13.8++14.38=13.94

  • 标准差:

    s20.26

第二步:检验方差齐性

用 F 检验:

F=s12s22=0.3920.2620.15210.06762.25

查 F 表(自由度 v₁=9, v₂=7, α=0.05):

  • 临界值大约为 3.68

因为 F = 2.25 < 3.68,接受原假设,认为方差齐性,可使用合并标准差。


第三步:计算合并标准差 sp 和 t 值

合并标准差:

sp=(n11)s12+(n21)s22n1+n22=(9)(0.1521)+(7)(0.0676)161.3685+0.4732160.11520.34

T 统计量:

t=x¯1x¯2sp1n1+1n2=12.2313.940.34110+18=1.710.340.2251.710.340.47431.710.16110.62

第四步:查临界值并做结论

自由度 df=n1+n22=16

查单尾 t 表,α = 0.05,df = 16:

  • 临界值 t0.05(16)1.746

因为 t=10.62<1.746,落入拒绝域。


结论:

在显著性水平 α = 0.05 下,污染河段鲫鱼的平均体长显著小于清洁河段,即差异具有统计学意义。

最后更新于:

Released under the MIT License.